#OpenAI Sora | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#OpenAI Sora

【十五五】重塑“視”界：AI視訊產業的戰略崛起與“十五五”發展藍圖

前言如果說過去十年是移動網際網路重塑資訊傳播方式的十年，那麼站在“十五五”規劃開局之年的我們，正清晰地見證一場由人工智慧驅動的、更為深刻的視聽產業革命。AI視訊生成已從一個前沿概念，急速演進為驅動文化新質生產力、重構數字經濟版圖的核心引擎。從OpenAI的Sora引發全球驚嘆，到國內快手可靈、美圖等產品的快速商業化落地，再到《北京市促進“人工智慧+視聽”產業高品質發展行動方案（2025-2029年）》的率先出台，一個技術、政策與市場共振的產業發展“奇點”已然來臨。本文將深入剖析AI視訊產業的技術核心、市場動態、競爭格局與政策環境，勾勒其如何與國家“十五五”戰略同頻共振，賦能千行百業。一、頂層戰略與政策領航：為產業注入“確定性”任何顛覆性技術的規模化發展，都離不開清晰的國家戰略與穩健的政策框架護航。AI視訊產業正深度融入國家現代化宏偉藍圖，其發展軌跡獲得了強有力的頂層設計支援。國家層面的戰略定位極為明確。2025年9月發佈的《國務院關於深入實施“人工智慧+”行動的意見》（國發〔2025〕11號）是統領全域的綱領性檔案，不再將人工智慧視為孤立技術，而是定位為與經濟社會各領域深度融合、催生新質生產力的核心驅動力。檔案設定了清晰目標：到2027年，人工智慧將在六大重點領域深度應用，新一代智能終端、智能體等應用普及率超過70%；到2030年，人工智慧將全面賦能高品質發展，智能經濟成為重要增長極。這為AI視訊在各行各業的應用普及提供了明確的時間表和廣闊的想像空間。在“人工智慧+”的宏大敘事中，視聽產業因其巨大的文化影響力、經濟價值和民生關聯度，成為率先落地的關鍵領域。地方政府反應迅速，以北京市2025年11月發佈的“人工智慧+視聽PILOT領航計畫”為代表，堪稱一份前瞻性、系統性的產業發展路線圖。該計畫核心是“五位一體”的系統性推進：Platform（技術平台）攻堅垂類大模型；Innovation（內容創新）推動AI在影視、動畫等內容全鏈條應用；Landscape（場景賦能）覆蓋智慧影棚、文商旅體融合等領域；Optimization（服務最佳化）搭建智能體開發等平台；Trust（安全信任）探索“監管沙盒”，建構安全體系。這一方案標誌著發展思路已從單點技術突破，升級為建構技術、資料、平台、應用、安全協同進化的完整產業生態。圖表：國家及地方AI視訊產業核心政策時間軸資料來源：中投產業研究院整理圖表：北京市“人工智慧+視聽PILOT領航計畫”五維協同體系資料來源：政府機構官網、中投產業研究院二、技術突破與範式革命：從“工具”到“世界模型”的躍遷產業爆發的根源在於技術的代際飛躍。AI視訊生成技術在過去兩年完成了從“可用”到“好用”的關鍵跨越，其演進路徑清晰地指向對物理世界理解和模擬的更高維度。技術架構的演進是這場革命的基石。行業早期依賴生成對抗網路（GAN），隨後擴散模型（Diffusion Model）與Transformer架構的結合成為主流。當前，以OpenAI的Sora為代表的擴散型Transformer（DiT）架構成為前沿，它將Transformer的強大序列建模能力應用於擴散過程的潛在空間，從而能夠處理更複雜的時空關係。例如，Sora模型已能生成長達分鐘級、物理邏輯更一致的高品質視訊，這不僅是時長的延長，更是對場景動態合理性理解的質變。可以說，AI正在從“剪輯師”向“導演”進化。技術進步直接體現在產品性能的躍升和成本的陡降上。目前，頂級模型已能支援生成長達數分鐘的4K解析度視訊。更關鍵的是，成本優勢已成為顛覆傳統行業的“殺手鐧”。根據行業權威分析，目前國內外主流AI視訊生成API的單秒成本已降至0.2至1元人民幣區間。相比之下，傳統視訊製作成本呈幾何級數差異：本土電視廣告（TVC）視訊製作成本約在千元級/秒，而頂級動畫電影的製作成本甚至高達十萬元級/秒。這種千百倍的成本差異，為視訊內容的大規模、個性化生產掃清了經濟障礙。圖表：AI視訊生成技術演進路線圖資料來源：中投產業研究院圖表：AI視訊生成與傳統視訊製作成本對比柱狀圖資料來源：中投產業研究院三、市場爆發與競爭重塑：全球格局下的中國力量在技術與政策的雙輪驅動下，全球AI視訊市場正以驚人速度擴張，中國不僅成為最重要增長極之一，更在技術和商業化層面湧現出具有全球競爭力的參與者。全球市場規模與增長前景廣闊。根據Fortune Business Insights的預測，全球AI視訊生成器市場規模預計將從2025年的7.168億美元增長至2032年的25.629億美元，年複合增長率高達20%。亞太地區是增長最快市場，年複合增長率預計達23.8%，中國是主要驅動力。市場增長的底層動力是視訊在全球數字內容消費中佔據主導地位（據Cisco VNI預測，視訊已佔全球移動網際網路流量的70%以上）以及AI帶來的生產效率革命。競爭格局呈現多元化態勢，中國力量表現亮眼。海外廠商如Runway、OpenAI （Sora）在技術和創意社區影響力方面領先。據報導，Runway在2024年12月的年度經常性收入已達8400萬美元，顯示出強勁的商業化勢頭。與此同時，中國廠商如快手可靈（Kling）、美圖、字節跳動的剪映即夢等產品已躋身全球第一梯隊。在商業化上，中國廠商展現出更快速度和更靈活策略。例如，快手可靈（Kling）在2025年初實現了顯著的商業突破，年化收入運行率迅速攀升，凸顯出國內市場的巨大潛力和強大的商業化能力。此外，國內產品通常具有更優的性價比，降低了使用門檻，加速了技術在中小企業和個人創作者中的普及。圖表：全球AI視訊生成器市場規模預測折線圖（2025-2032）資料來源：Fortune Business Insights、中投產業研究院圖表：全球主要AI視訊模型性能與商業化對比氣泡圖資料來源：麥肯錫、BCG、中投產業研究院四、應用賦能與產業融合：催生“智能原生”新業態AI視訊技術的真正價值在於其作為“基礎能力”與千行百業融合後催生的“化學反應”，正在重塑從內容創作到產業營運的完整價值鏈。首先是內容產業自身的工業化升級。 AI已能深度參與劇本構思、分鏡生成、視訊生成與剪輯的全流程。這催生了如“AI漫劇”等新形態——以漫畫或小說IP為基礎，通過AI快速生成統一風格的動態短影片，極大縮短了IP視覺化周期。對於影視動漫行業，這意味著能夠以更低成本、更高效率進行“大規模個性化內容生產”。其次是賦能實體經濟，創造沉浸式體驗與增長新動能。在電商與零售領域，AI生成的個性化商品展示視訊能顯著提升轉化率。據Adobe Digital Insights報告，採用高品質視訊素材的電商頁面點選率可比圖文高出30%以上。在文旅與教育領域，通過AIGC技術對文物古蹟進行活化宣傳，可以打造沉浸式歷史文化體驗。在工業與科研領域，AI生成的高擬真視訊可用於自動駕駛演算法訓練和科學可視化，加速創新處理程序。最終，所有應用將匯聚於“智能終端”的革新。未來的AI電視、AI手機、AI眼鏡乃至智能汽車，將不再是簡單的播放裝置，而是具備本地化即時生成、理解和互動視訊內容能力的“智能體”。圖表：AI視訊在重點行業應用效果對比圖資料來源：中投產業研究院圖表：AI視訊賦能產業生態全景圖資料來源：中投產業研究院五、未來挑戰與核心關切：在創新與治理中尋求平衡前景雖廣闊，但邁向成熟的產業必須清醒應對挑戰。這些是“十五五”期間政策與產業界需共同攻克的核心議題。技術瓶頸與工程化鴻溝依然存在。當前AI生成視訊在複雜敘事邏輯、長程時序一致性上仍存不足，從生成單段視訊到支撐完整工業化工作流，仍需大量工程化創新。資料、算力與成本約束是產業可持續發展的關鍵。高品質、合規的視聽資料集建設挑戰巨大，同時大模型對智能算力的需求持續攀升。版權、倫理與安全風險是監管與產業發展的核心交匯點。 AI生成內容的智慧財產權歸屬、深度偽造技術濫用等風險亟待規範。北京方案中提出的“監管沙盒”機制正是前瞻性佈局。此外，既懂AI演算法又精通視聽藝術的複合型“智匠”人才短缺，也制約著產業發展。總而言之，AI視訊產業已告別野蠻生長期，步入與國家級戰略深度融合、在規範中加速創新的新階段。中國的獨特優勢在於統一的頂層戰略、豐富的應用場景、快速迭代的工程化能力以及積極審慎的治理框架。抓住這一機遇，不僅能培育兆級智能經濟新增長極，更將在建構數字時代文化軟實力和國際競爭新優勢中，佔據戰略制高點。這場由AI掀起的視覺革命，畫卷剛剛展開，其波瀾壯闊的未來，正待我們共同書寫。 (中投未來產業研究中心)

OpenAI收緊Sora監管！

當地時間周一（10月20日），人工智慧（AI）研究公司OpenAI發佈聯合聲明稱，將與演員布萊恩·克蘭斯頓、美國演員工會（SAG-AFTRA）及其他表演者工會合作，防範其AI視訊生成應用Sora的深度偽造（Deepfake）內容。據美國演員工會在社交媒體平台X上發佈的資訊，在9月底Sora 2上線後，有使用者在平台上生成了未經授權、模仿克蘭斯頓聲音與形象的AI視訊，引發了這位《絕命毒師》主演的擔憂。克蘭斯頓在聲明中表示：“感謝OpenAI制定政策並完善防護機制，並希望他們以及所有從事這一領域的公司，能夠尊重我們管理個人聲音與形象複製權的職業權利。”除了美國演員工會之外，OpenAI還宣佈將與代表克蘭斯頓的聯合人才經紀公司（UTA）、經紀人協會（ATA）及創意藝術家經紀公司（CAA）展開合作，以進一步強化對未經授權AI生成內容的防護。此前，CAA和UTA曾公開批評OpenAI在Sora中使用受版權保護素材的做法，稱其對客戶及其智慧財產權構成威脅。上周，因Sora使用者生成對民權領袖馬丁·路德·金的不敬形象，OpenAI應馬丁·路德·金遺產委員會的要求，在Sora平台封禁了相關視訊。自9月30日Sora 2推出以來，OpenAI在版權與肖像使用政策方面持續調整。10月3日，OpenAI首席執行官薩姆·奧爾特曼更新了Sora的“退出（opt-out）政策”。該政策此前允許使用智慧財產權內容，除非版權方明確要求停用；新政策則賦予權利人“更精細的角色生成控制權”。在Sora推出時，平台就要求對個人聲音與肖像的使用需經授權同意（opt-in）。OpenAI隨後又進一步承諾稱，將迅速回應任何相關投訴。OpenAI還重申支援美國的《禁止偽造法案》，該法案旨在防止未經授權AI生成他人聲音或肖像。 (科創日報)

Sam Altman深夜爆料：ChatGPT的成功，一半靠運氣！

OpenAI這一個月有多瘋狂？CEO Sam Altman剛接受完採訪，資訊量大到炸裂——從兆美元基建投資到Sora爆火，從版權風波到AI創作革命，每一個話題都足以刷屏。💡兆投資不是泡沫，是"必須花的錢"當被問到OpenAI宣佈的一系列基建合作（從Nvidia到AMD再到三星）是否是"AI泡沫"時，Altman的回答很直白："我們會花很多錢在基礎設施上，這是公司層面的豪賭。對還是錯？我們會知道答案，但這就是我們的決定。"他坦言，自己大部分時間都在處理基礎設施問題："要同時搞定晶片產能、資料中心、電力裝置、消費者需求……這些事必須同時發生，不能一件一件來。" 🤖有意思的是，Altman說自己其實不適合當大公司CEO："如果讓我選天賦所在，我更適合當投資人。"但正是投資人的思維訓練，讓他懂得如何在指數級增長的世界裡分配資本，如何押注那些看起來瘋狂但潛力無限的項目。ChatGPT的成功，一半靠實力一半靠運氣Altman承認了兩個"意外"：一是ChatGPT比預期火得多，二是某些大科技公司在ChatGPT發佈後的反應太慢，給了OpenAI建立優勢的時間窗口。他沒點名，但暗示Google在早期掉鏈子了。不過他也強調，過去兩年半的發展基本按計畫進行："我們很早就在思考基礎設施建設、應用生態、API和消費者業務的統一。"換句話說，最初的窗口期是運氣，但之後的執行是實力。🔥Sora創作者佔比30%：AI讓更多人成為創作者Sora上線後，資料讓團隊都驚了：前幾天，30%多的活躍使用者都在創作內容！這打破了網際網路的"90/9/1法則"（90%的人只看不創作）。Altman說："我們一直低估了人類的創作慾望。如果能大幅降低創作門檻，遠比1%的人會去創作。"他還提到，很多人用Sora生成搞笑視訊發給三五好友，這種小圈子社交需求遠超預期，但也意味著現有的廣告模式可能撐不住成本，使用者可能得為生成視訊付費。💬版權風波的意外發現：視訊比圖片更敏感Sora剛發佈時，網上出現了各種動漫角色的AI生成視訊（比如皮卡丘、海綿寶寶），版權方反應激烈。Altman說，他們低估了視訊和靜態圖片的差異："視訊給人的感覺更真實、更有情感衝擊力，版權方的態度和圖片完全不同。"但他預測，一年後情況會反轉："到時候版權方可能會抱怨'為什麼我的內容沒被用在更多視訊裡？'因為他們會發現，這能加深粉絲連接。" 🚀AI會搶走工作嗎？Altman說不會關於AI對就業的影響，Altman給出了一個溫暖的答案："人類喜歡為別人做事，喜歡被認可和欣賞。所以我們會找到新的方式去幫助別人、為別人創造價值。"他認為，AI創作工具的爆火恰恰證明了這一點——人們渴望表達、渴望被看見。未來幾個月還有大動作當被問到三星、AMD等一系列合作如何整合時，Altman賣了個關子："再給我們幾個月，一切都會說得通。我們沒有看起來那麼瘋狂，是有計畫的。"看來，OpenAI的基建拼圖還沒拼完，接下來可能還有重磅合作要宣佈。💥你覺得OpenAI這種"全押"策略能成功嗎？AI創作真的會讓人人都成為創作者嗎？歡迎評論區聊聊你的看法！ 👀✨ (澤問科技)

Sam Altman：我承認我之前錯了，AI 超級系統才是 OpenAI 真正想要的

OpenAI 最近操作不斷，Sora App、Dev Day 的密集發佈、與 Nvidia、AMD 的各種協議合作等等。很明顯，在 ChatGPT 和基礎模型之外，他們想要更多。「我們的目標並不是做「超級 App」，而是要建構一個真正強大的 AI 超級系統。」在 a16z 最近的訪談中，Sam Altman 描述了他們的目標：一個集前沿研究、超大規模基礎設施和消費級產品於一體的超級系統。一個人人會使用的個人 AI 訂閱服務，使用者不僅能在 OpenAI 的消費產品裡使用它，還能用它登錄許多其他服務，未來某個時候，還可以通過專用硬體來使用它。一個無處不在的 ChatGPT，一個整合了產品、基礎設施和硬體的超級公司。訪談中，Altman 還分享了很多他對於業務的實際思考，包括對於不同業務的底層邏輯思考、現在的產品策略是什麼、為什麼要做 AI 基建、Sora 的盈利模式、對於 agent 的看法等等。Apps 和 ChatGPT 的結合非常棒。未來，開發者會找到一種非常適合他們的新分發機制。iPhone 就是一個垂直整合的例子。我認為 iPhone 是科技行業有史以來最了不起的產品，而且它實現了極高的垂直整合度。關於護城河，我覺得沒有通用的「最佳答案」。我的回答是：你找到了一些，只對你當前產品、技術、市場定位在這個時間點上才成立的獨特東西。而這類東西，往往構成了你能創造巨大價值的核心。社會與技術必須共同演進。你不能等到最後把一個完美的東西直接扔給世界，這行不通。它必須是一個持續的、相互適應的過程。Sora 的一個很酷的地方在於解鎖了未來的互動方向，未來的互動介面可能是一個由 AI 即時渲染出來的動態視訊世界。01 OpenAI 的方向：做一家垂直整合的 AGI 公司主持人：在 2025 DevDay 上，你對發佈的那部分內容最感興趣？Sam Altman：所有。非要說一個重點，是 App 和 ChatGPT 的結合。但我覺得我們還需要一些迭代，來摸索出人們真正想怎麼用這些東西。比如：使用者到底更傾向於通過呼叫某個應用來完成任務，還是希望 ChatGPT 本身就知道他們想幹什麼並主動推薦？我認為，開發者最終會找到一種新的分發機制，非常適合他們。但說到底，這些產品推向世界後，總是會帶來一些意想不到的驚喜。主持人：OpenAI 現在很複雜，是一個消費級科技公司，一個 scaling 的 infra 營運商，一個 research lab，還有硬體，應用程式商店等等。OpenAI 到底想做什麼？Sam Altman：是的，可以看作是三家公司，或者說，第四部分是我們以自己的方式打造的、一個規模龐大的研究實驗室。但核心業務主要有三個。我們希望成為人們的個人 AI 訂閱服務，我認為大多數人都會訂閱一個，有些人可能會訂閱好幾個。你不僅能在我們自家的消費產品裡使用它，還能用它登錄許多其他服務，未來某個時候，你還可以通過專用硬體來使用它。最終，你會擁有一個真正瞭解你、並且對你非常有用的 AI，這就是我們想做的。事實證明，為了支撐這一切，我們還必須建設海量的基礎設施。但這套基礎設施的目標，或者說我們真正的使命，始終是「AGI，並使其對全人類有益」。主持人：你們的基礎設施未來會成為一項獨立業務，還是只服務於個人 AI訂閱這個核心目標？Sam Altman：你是說，我們會不會把基礎設施作為服務賣給其他公司？直覺上，它未來可能會衍生出一些別的用途，但我們目前還沒有明確的計畫。目前我們的計畫只是支援我們想要提供的服務和研究。主持人：在 ChatGPT 還沒有出現的時候，你開玩笑說 OpenAI 的商業模式要去問 AI，現在來看，這句玩笑話是不是比我們想像的更認真？Sam Altman：那句話並不完全是玩笑。但我們確實有好幾次，包括最近一次，向當時最新的模型詢問我們應該怎麼做，它都給出了我們自己沒注意到、但很有洞察力的答案。能實現的關鍵在於你得給它足夠多的背景資訊。所以，當我那麼說的時候，大家可能只把它當成一句趣話，但其實它既有玩笑的成分，也有認真的成分。主持人：除了擴大分發和算力之外，連接這些不同業務的底層邏輯是什麼？Sam Altman：研究讓我們能做出偉大的產品，而基礎設施讓我們能進行研究。所以它就像一個垂直整合的技術堆疊。你可以用 ChatGPT 或其他服務來獲取建議，但要讓它有效，背後需要前沿的研究和大量的基礎設施。所以，它們其實是一回事。我過去一直反對垂直整合，但現在我覺得我可能錯了。人們總希望經濟是高效的，理論上公司應該只做一件事，然後與其他公司協作。但在我們的案例中，至少目前看來並不是這樣的。OpenAI 的發展經歷告訴我們，為了實現我們的使命，我們必須做比最初想像中更多的事情。iPhone 就是一個垂直整合的例子。我認為 iPhone 是科技行業有史以來最了不起的產品，而且它實現了極高的垂直整合度。02 OpenAI 不想只做「超級 App」主持人：談談你們的產品戰略。最終是想打造一個無所不包的「超級應用」，還是一個由多個應用構成的「超級系統」？Sam Altman：我們的目標並不是做「超級 App」，而是要建構一個真正強大的 AI 超級系統。Sora 作為一個獨立的應用發佈，而不是整合到 ChatGPT 裡，是因為對很多使用者來說，ChatGPT 是他們最私人的帳號之一。如果把一個「社交體驗」也強行塞進去，感覺會很奇怪。你可以想像加入一些「消息」功能，因為很多人確實會分享內容、進行協作。但從使用者心態來看，他們對 ChatGPT 的認知，和對一個娛樂類 App 的認知是完全不同的，混在一起會有割裂感。當然，我們也會把很多功能直接加到 ChatGPT 裡，但有些東西還是更適合獨立發佈。主持人：你覺得現在人們可以建構那些真正重要、有用的 Agent？你最看好那一類？Sam Altman：我覺得可以參考一下 Codex 的發展，然後把這種思路推廣到其他行業。比如：能不能為法律、金融建模，或其他我們已經看到早期成功案例的領域，打造像 Codex 一樣的體驗？其實現在已經有一些很棒的初創公司在做這些方向了。隨著技術的成熟，如果你能讓這些 Agent 在各自行業中，做到像 Codex 在程式設計領域那樣強大，那將是我最感興趣的方向之一。想像一下未來的場景：一個人只需要和一堆 Agent 對話，就能啟動一個公司。現在的 Agent Builder 和 AgentKit 還沒完全達到這個水平，但我能看到我們正在往這個方向靠近。主持人：聊回你之前提的「一人十億美元公司」賭局。距離一個能真正獨立幹完一周工作、完全不用人操心的 Agent，還有多遠？Sam Altman：我覺得，像 Code Interpreter（程式碼直譯器）這樣的工具，距離完成「一周的工作量」其實已經不遠了。雖然聽起來有點瘋狂，但我覺得這並不是一個遙不可及的 2025 年目標。我和一些人聊起這事，他們也很驚訝地說：「它現在真的已經能完成一天的任務了？怎麼發展得這麼快？」老實說，我通常不會覺得 AI 的進步有多誇張，但在 ChatGPT Code Interpreter 能完成的任務長度這個方面，我真的感受到一種爆炸式的進展。所以我猜，一周等級的任務，可能真的很快就能實現。主持人：要實現這種 Agent，還需要那些技術上的突破？Sam Altman：更聰明的模型、更長的上下文處理能力、更好的記憶系統。主持人：AI 極大地降低了開發門檻，你認為初創公司真正的護城河（moat）在那裡？是資料、分發，還是獨特的工作流？Sam Altman：我覺得挺難回答的。我認為最好的「獨特優勢」，往往是你自己為你要做的事情量身打造的。我們在 OpenAI 也花了很多精力去找到這一點。我覺得這沒有通用的「最佳答案」。最好的回答應該是：你找到了一些，只對你當前產品、技術、市場定位在這個時間點上才成立的獨特東西。而這類東西，往往就構成了你能創造巨大價值的核心。不過，有一點通用的建議我可以說：你是在做的過程中逐步發現優勢的。我很喜歡一句經典的商業名言，「讓戰術變成戰略。」你可以先從一些「有用、能跑得通的事情」開始，往往在這個過程中，就會慢慢浮現出某些可以上升為戰略的東西。如果你在我們剛開始做 ChatGPT 的時候問我：「你們未來會有什麼持久的優勢？」我可能會說「我也不知道」，或者給你一堆猜測，但不會有特別自信的答案。但現在回頭看，像「記憶」功能，其實就成為了一個非常強的競爭優勢，也是使用者持續使用 ChatGPT 的重要原因之一，但當時我們壓根沒想到這點。所以你在建構功能時，有時會意外地發現：「哇，這個點其實可以成為我們長期的護城河。」這就是你一邊走、一邊找、慢慢形成的過程。主持人：如果我們站在 GPT-6 的時代回望今天，你認為什麼樣的產品決策，能讓應用經受住時間的考驗？Sam Altman：最終還是得你自己去摸索出來。我覺得 AI 雖然改變了世界上很多事情，但它並沒有改變一個公司獲得優勢的底層機制。比如說，網路效應、品牌和市場優勢、使用者資料、平台或市場的雙邊效應等等，這些因素過去行得通，現在依然有效。如果你去列一個近幾年成功企業的清單，那些驅動力大機率現在也還適用。只不過，現在可能會有一些新的策略、新的打法。03 瘋狂推進 AI基建，繼續做產業鏈整合主持人：作為 CEO，你最近和 AMD、Oracle 等公司達成了一系列合作。與早年相比，你在達成這些交易時的思路有什麼變化？Sam Altman：我那時確實沒什麼營運和管理經驗。我天生不是那種適合經營公司的人，更擅長做投資。我之前就是幹這個的，也一度以為那就是我的職業方向了。我在那之前也當過 CEO，但當得不好。所以我認為，在做那筆交易時，我的心態更像一個為公司提供建議的投資者。而現在，我明白了真正營運一家公司是什麼感覺。我花了很多時間才學會怎麼把一筆交易真正在營運層面落地，怎麼去考慮協議背後所有的連鎖反應，而不僅僅是盯著「拿到錢和管道」這麼簡單。主持人：你們既與這些公司合作，也存在潛在的競爭關係。你是如何決定何時合作、何時競爭的？Sam Altman：我們已經下定決心，是時候進行一次非常激進的基礎設施投資了。因為我對我們未來的研究路線圖，以及這些新模型能創造的經濟價值，從未像現在這樣充滿信心。但要在如此大的規模上進行投資，我們需要整個行業，或者說行業裡的一大批關鍵角色來共同支援。這涉及到從最底層的硬體（electrons）到最上層的模型分發，以及中間所有環節。因此，我們會和非常非常多的人合作。在未來幾個月，你會看到我們在這方面有更多動作。主持人：當你談到擴張規模時，似乎沒有上限。在你看來，限制 OpenAI 規模的因素是什麼？Sam Altman：上限肯定是有的。比如全球的 GDP 就是一個硬上限，其中知識型工作又只佔一部分，而且我們目前還沒涉足機器人領域。所以限制是客觀存在的，但感覺這些限制離我們今天的水平還非常遙遠。如果我們對模型能力發展方向的判斷是正確的，那麼它能釋放的經濟價值就有極大的想像空間。如果你只有今天的模型，當然不會按那個規模去擴張。不過，即便如此我們還是會繼續擴張，因為我們能清楚地看到，僅憑現有模型，就有大量需求我們無法滿足。但如果我們只有今天的模型，我們不會如此激進地擴張。是因為我們看到的不僅僅是今天的模型，我們能比市場提前一兩年看到未來。主持人：那些投入是為了實現 AGI，那些又是為了避險不確定性的？Sam Altman：表面上看，Sora 似乎與 AGI 不太相關。但我敢打賭，如果我們能建構出非常出色的世界模型，它對 AGI 的重要性將遠超人們的想像。這和 ChatGPT 的情況很像。當初也有很多人覺得它離 AGI 很遠，但它卻給我們帶來了巨大的幫助：不僅讓我們能訓練出更好的模型，也讓我們第一次真正瞭解社會想怎麼用這項技術，更重要的是，它迫使整個社會開始認真對待 AGI。在 ChatGPT 出現前的很長一段時間裡，我們談論 AGI，人們要麼覺得這不可能發生，要麼根本不關心。是 ChatGPT 的出現，才讓大家突然開始關心這件事。所以，撇開研究上的好處不談，我堅信，社會與技術必須共同演進。你不能等到最後把一個完美的東西直接扔給世界，那行不通。它必須是一個持續的、相互適應的過程。主持人：你曾說過，在職業上你最關心的兩件事是 AI 和能源。現在這兩者是如何融合在一起的？Sam Altman：我當時並不知道它們最終會成為同一件事。它們原本是兩個獨立的興趣，但現在確實融合在一起了。回顧歷史，改善人們生活質量最具影響力的因素就是更廉價、更豐富的能源。所以，進一步推動能源發展是個好主意。每個人看世界的角度不同，而在我的視角裡，能源無處不在。主持人：隨著 AI 對能源需求的激增，你認為未來的能源結構會是怎樣的？政策上應該如何應對？Sam Altman：我預計短期內，美國新增的基荷電力主要會來自天然氣。但長期來看，我相信主導能源將是太陽能加儲能以及核能的某種組合。具體比例不好說，但這兩種會是未來的主力。這包括了先進的裂變技術、小型模組化反應堆（SMRs）以及核聚變等整個技術方向。04 發佈 Sora 2 的目的是「共同演進」主持人：Sora 在你們的戰略中扮演什麼角色？為什麼要把寶貴的 GPU 資源投入到 Sora 上，這是一種長短期的權衡嗎？Sam Altman：Sora 有幾個層面的意義。首先，能做出人們喜歡的好產品，本身就是一件很酷的事。其次，也是更重要的一點，這正是我所說的「共同演進」：讓社會提前感受即將到來的技術。很快，世界就必須面對強大的視訊模型，它們能深度偽造任何人，能生成任何你想要的畫面。這大部分是好事，但社會也需要一個適應期。就像 ChatGPT 一樣，我們覺得世界需要瞭解這項技術的發展方向。我認為讓世界盡快瞭解視訊技術的發展方向非常重要，因為視訊比文字更具情感共鳴力，很快我們將進入一個視訊無處不在的世界。除此之外，就像我前面提到的，Sora 對我們的研究計畫有幫助，也是通往 AGI 路上的一部分。而且話說回來，AI 的意義也不該只是追求極致的效率、解決所有問題。這條路上也應該有樂趣、喜悅和創造力。當然，我們不會把海量的算力都投給它，Sora 只佔了我們總算力的一小部分而已。主持人：你曾說模型已經讓聊天這個應用場景飽和了。未來的 AI 人機互動，在軟硬體上會是什麼樣的？Sam Altman：我需要澄清一下，我當時說「聊天」飽和，指的是一個很窄的範圍：如果你只是想進行簡單的日常對話，那現在的模型確實已經很好了。但是，作為一個互動介面，「聊天」的潛力還遠沒有達到飽和。比如，你可以對聊天介面說：「請治癒癌症。」模型顯然還做不到。所以我認為，文字互動這種形式還有很長的路要走，即便對於閒聊類的應用，模型已經很出色了。當然，未來肯定還會有更好的互動介面出現。Sora 的一個很酷的地方在於，想像一下，未來的互動介面可能是一個由 AI 即時渲染出來的動態視訊世界。這會解鎖多少可能性？另外，你也可以想像新型的硬體裝置，它們能時刻感知周圍環境的狀況。你的手機不會再隨時用簡訊通知來打擾你，而是能真正理解你的處境，知道在什麼時候向你展示什麼內容。所有這些都還有很長的路要走。05 Sora 的盈利模式可能是按次收費主持人：關於盈利模式，你目前最關心或者正在探索的方向是什麼？Sam Altman：我現在最關心的是 Sora 的盈利模式，因為它剛剛發佈，使用量非常大。發佈這種產品總能讓你學到一件事：使用者實際用它的方式，和你最初設想的差別有多大。大家當然在用我們預想的方式使用 Sora，但同時也出現了大量我們沒想到的用法，比如生成自己和朋友的搞笑表情包，然後在群聊裡分享。這需要一種非常不同的盈利模式。Sora 視訊的製作成本很高。對於每天生成幾百次的使用者來說，這將需要一種與我們原先設想的完全不同的盈利方式。Sora 背後有一個很酷的假設，那就是人們其實有強烈的創作慾望，並不是傳統網際網路理論裡說的只有 1% 的人創作。可能只是過去的工具門檻太高了。我覺得這是個非常棒的轉變，但這也意味著我們必須為這種高頻的創作行為，找到一種全新的、可持續的盈利模式。我猜，對於這種高成本的生成，可能最終還是得按次收費。主持人：對於長尾使用者，你考慮過廣告變現嗎？Sam Altman：持開放態度。和許多人一樣，我覺得廣告有點令人討厭，但並非完全不可行。有些廣告我甚至很喜歡，比如我很讚賞 Meta 的一點是，Instagram 的廣告對我來說常常是加分項，我確實喜歡看。人們對 ChatGPT 有著非常高的信任關係，即使它出錯、產生幻覺，人們也覺得它在努力幫助他們，做正確的事。如果我們破壞了這種信任，比如當使用者問「我該買那款咖啡機？」時，我們推薦的不是最好的，而是付了錢給我們的一款，那麼這種信任就會消失。所以那種廣告是行不通的。但我能想像到其他一些類型的廣告是完全可行的，只是在設計上必須極其小心，避免踩進那些明顯的坑裡。主持人：你怎麼看版權問題的未來走向？比如，訓練資料是否屬於「合理使用」？Sam Altman：這是我目前的猜測。正如社會與技術共同演進一樣，隨著技術向不同方向發展，情況也會變化。比如我們已經看到，版權方對視訊模型的反應，就和當初對圖像模型的反應很不一樣。所以這個領域會持續演變。但如果讓我從今天的立場做一個預測，我認為社會最終會接受：AI 用公開資料進行訓練屬於「合理使用」（fair use）。但在生成內容時，會有一套新的模式，比如你要模仿特定風格或使用某個 IP。這就像一個作家，可以閱讀一部小說並從中獲得一些靈感，但不能直接抄襲。你可以討論哈利·波特，但你不能把整本書背出來當成自己的作品。另外，我覺得還有一件事正在發生變化，這點在 Sora 上特別明顯。我們當然收到了很多版權方的擔憂，但同時也收到了很多另一種聲音：他們擔心的不是我們用了他們的角色，而是我們用得還不夠多。他們當然也需要限制，不希望自己的角色說出一些瘋狂或者冒犯的話，但他們更希望粉絲能和角色互動，因為這樣才能建立情感連接，讓他們的 IP 更有價值。如果我們的模型總是選擇別人的角色而不是他們的，他們反而會不高興。所以，我完全可以想像這樣一個世界：在版權持有者自己決策的前提下，他們擔心的將不再是「用太多」，而是「用太少」。06 AGI 的核心是發現新知識，AI 科學家是未來方向主持人：從 ChatGPT 發佈到現在，AI 的發展肯定有很多超出你預料的地方。如果讓你只挑一件，什麼事最讓你感到驚訝，甚至徹底改變了你之前的某些判斷？Sam Altman：有很多事讓我驚訝，但最有趣的是我們發現了多少「新東西」。當初我們發現語言模型的 Scaling Laws 時，我們以為自己偶然發現了一個巨大的秘密，這感覺像是一次不可思議的勝利。我當時想，我們可能再也不會有這麼好的運氣了。但深度學習就像一個不斷創造奇蹟的源泉，我們接二連三地取得了突破。當我們再次在推理模型上取得突破時，我同樣覺得，這樣的好運可能不會再有第二次了。這項技術能如此成功，似乎是一件機率極小的事情。但後來我想，也許所有重大的科學發現都是這樣：當它足夠基礎、足夠根本時，它的潛力就會持續不斷地湧現出來。但進展的速度非常快，如果你現在回頭去用 ChatGPT 剛發佈時的 GPT-3.5，你會覺得：「我簡直不敢相信當時有人會用這個東西。」而現在，我們已經創造出了巨大的「能力富餘」（capability overhang）。普通大眾對 AI 的理解還停留在 ChatGPT 的水平；然後矽谷的一些技術愛好者在使用 Codex，他們會覺得普通人根本不懂 AI 已經發展到什麼程度了；而極少數頂尖科學家又會覺得，那些用 Codex 的人也同樣不瞭解前沿模型真正的潛力。今天，模型的能力和公眾的認知之間已經存在巨大的鴻溝，我們在能力上已經走了非常非常遠。主持人：我們用大語言模型（LLM）到底能走多遠？在那個節點會需要新的技術架構或突破？Sam Altman：我認為，僅憑現有的技術路線，我們就能走得足夠遠，遠到足以創造出一個能幫我們找到下一條技術路線的 AI。我知道這個答案聽起來有點像自我循環，但你想想，如果基於 LLM 的系統，它的研究能力能超過整個 OpenAI 團隊的總和，那或許就足夠我們抵達下一個里程碑了。主持人：你之前對 AGI 的定義是：當它在大多數具有經濟價值的任務上超過人類。如果某個模型在 GDPval 的得分達到某個程度，你會認為 AGI 實現了嗎？註：GDPval 是 OpenAI 於 2025 年 9 月 25 日提出的一項新的評估方法，用於衡量 44 個職業中具有經濟價值的現實任務的模型性能。Sam Altman：我最近也在認真思考這個問題。首先，像很多人一樣，我對 AGI 也有多個定義。離目標越近，這個概念反而越模糊。但對我來說，最重要、也是讓我最驚喜的一點是：我們已經開始看到 AI 具備「發現新知識」的能力了。也就是說，AI 可以擴展人類目前的知識邊界。雖然現在這些例子還很小，但這才是我最在意的突破。主持人：我們往後看幾年，你認為 AI 模型下一個真正讓人興奮的能力躍遷會是什麼？是更深度的白領工作替代、AI 科學家，還是人形機器人？Sam Altman：會有很多方面，但你提到了我最興奮的一點，「AI 科學家」。我知道關於圖靈測試的嚴格定義一直有爭議，但大眾理解的那個圖靈測試，早就被我們不經意間超越了。我們之前都覺得圖靈測試遙不可及，是 AI 領域的終極考驗。然後突然之間，它就被攻克了。全世界為此熱議了一兩個星期，然後大家很快接受了現實：「好吧，看來電腦現在也能聊天了。」然後一切照舊。我認為，科學領域正在發生同樣的事情。對我個人而言，真正的「圖靈測試」，是看 AI 能否獨立進行科學研究。那才是真正能改變世界的時刻。而隨著 GPT-5 的出現，我們已經開始看到一些微小的火花了。你會在 Twitter 上看到這樣的例子，有人分享它幫助自己有了一項新的數學發現，或者在我的物理、生物研究項目中解決了一些小問題。我們看到的一切都表明，這個方向將會有更大的發展。所以我認為，在兩年內，模型將能承擔更大部分的科學工作，並做出重要的發現。這是一件瘋狂的事情，將對世界產生巨大的影響。我一直相信，從根源上說，是科學進步在推動人類社會變得更好。如果我們即將迎來更多的科學進步，那將是一件大事。主持人：這很有趣，因為這是一個人們不常談論的積極變化。當談到 AI 變得極度聰明時，評論經常是聊到負面影響。但對於碳排放和疾病這些問題，我們確實需要更多的科學。Sam Altman：是的，這一點說得很好。我記得 Alan Turing 曾說過，有人問他：「你真的認為電腦會比傑出的人類頭腦更聰明嗎？」他回答說：「它不必比傑出頭腦更聰明，只需要比平庸的頭腦更聰明就行，比如像 AT&T 的總裁那樣。」 (Founder Park)

OpenAI的Sora上線5天就翻車了，CEO道歉！

上周，OpenAI發佈了AI視訊生成工具Sora，結果畫風急轉——各種動漫角色的AI生成視訊在網上瘋傳，版權方集體不滿。CEO Sam Altman緊急宣佈政策調整：版權方可以主動選擇是否授權，而不是被動退出。💡這場風波來得猝不及防。Altman坦言："我們以為大家對視訊的反應會和圖片差不多，結果完全不一樣。"原來，Sora就像打開了創意工具箱——任何人都能用文字指令生成10秒視訊，還能克隆自己或朋友的"數字分身"（官方叫"cameo"）。雖然系統設定了限制，但使用者還是找到了各種方法繞過規則。更讓人意外的是，很多使用者對"被AI克隆"的態度很糾結。有人想公開分身玩創意，但又擔心AI讓自己說不當言論或出現在爭議內容裡。OpenAI緊急上線新功能：使用者可以給自己的cameo設規則，比如"別讓我出現在某類視訊裡"或"禁止說某些詞"。🤖水印問題也引發熱議。Sora生成的視訊會打水印，但網上已經出現各種移除教學——有人用圖像處理工具，有人直接寫程式碼抹掉。更棘手的是，雖然技術上不允許生成陌生人面孔，但"高仿臉"已經讓不少人感到擔憂，有人用它製作不當內容。Altman的應對策略引發討論。他說，只有讓社會真實體驗這項技術，才能找到應對辦法："我們必須讓世界意識到，規則變了，難以分辨的AI視訊已經來了。"但質疑者指出，AI技術的發展史上，總有人受到負面影響——從演算法偏見到隱私侵犯，教訓不少。🔥儘管爭議不斷，Sora的爆火速度連OpenAI都沒想到。它在應用程式商店免費榜霸榜，增長曲線比ChatGPT還陡峭。OpenAI總裁Greg Brockman感慨："這說明一個問題——我們需要更多算力。"這也是OpenAI拚命投資AI基礎設施（聯合軟銀、甲骨文投資數千億美元）和AMD晶片合作的原因。Altman還透露，Sora目前盈利不是首要目標："我們現在處於積極投入階段，但我們有信心和耐心最終會實現盈利。"他強調，OpenAI對AI基礎設施的全鏈條都很感興趣，未來會有更多動作。 (澤問科技)

Sora首周下載量超越ChatGPT！

OpenAI的視訊生成應用程式Sora首周iOS下載量達62.7萬次，超越ChatGPT首周表現。上周，OpenAI的視訊生成應用程式Sora正式推出後，迅速登頂蘋果美國“熱門免費應用”（Top Free Apps）榜單。而本周，根據應用情報提供商Appfigures提供的新資料，它在蘋果iOS系統上的首周表現比ChatGPT當初的首周表現更為出色。Appfigures估算的資料顯示，Sora應用程式在首次發佈後的七天內獲得了627,000次iOS下載量，而ChatGPT應用程式在其發佈首周的iOS下載量為606,000次。只不過，由於ChatGPT在其推出的首周僅在美國可下載，而Sora則在美國和加拿大同時推出。若是除去加拿大市場貢獻的約45,000次安裝量，僅以美國的資料為準的話，Sora的首周下載量也佔了ChatGPT當初的約96%。這種程度的使用者接受度仍是非常值得關注的，因為Sora目前尚是作為一款邀請制應用，而ChatGPT在推出時則面向更廣泛的公眾開放，這一對比也意味著Sora的表現更加出色。穩定使用率在9月30日Sora應用程式發佈首日，Sora迅速獲得了56,000次應用下載，使其一舉躍升成為美國應用程式商店中下載量排名第三的綜合類應用。到了10月3日（上周五），其排名已升至榜首。這一迅猛增長已經使Sora的首次亮相領先於其他主要的人工智慧應用的發佈，包括初創公司Anthropic的Claude和微軟的Copilot，並使其與xAI的Grok發佈處於同一水平。此外，據Appfigures資料顯示，該應用程式自9月30日上市以來，一直保持著穩定的使用率。資料表明，10月1日的iOS日下載量達到了107,800次的峰值，此後其日下載量呈現出波動狀態。雖然這些數字不如本周早些時候那麼高，但對於一款並非所有人都能使用的應用程式來說，這仍然是相當不錯的成績。如果你日常瀏覽社交媒體就能發現，使用最新Sora 2生成的視訊近乎可以以假亂真。根據一些使用者在社媒上分享的視訊，用Sora 2新生成的視訊告別了早期人工智慧視訊的“跳戲感”，不再侷限於畫面拼接，而是真正學會了模擬現實世界的運轉邏輯；甚至，一些使用者還通過該模型“復活”了已故的籃球巨星科比·布萊恩特等名人。 (財聯社AI daily)

奧特曼回應一切：ChatGPT不是美國版微信，Sora是為假視訊時代「打預防針」|附萬字採訪

我們已經可以認真討論「零人公司」這件事了。2025 年 DevDay 現場，OpenAI CEO Sam Altman 在接受博主 Rowan Cheung 的採訪時拋出了這個觀點。語氣輕鬆，但份量不輕。資料支撐著他的底氣：ChatGPT 使用者周活躍使用者突破 8 億，周活躍開發者突破 400 萬，最近發佈的 AgentKit 讓普通人幾分鐘就能搭建複雜 Agent，AI 也開始在數學和科學領域做出「小小的發現」。這些成就背後藏著一個更深的問題：當 AI 能完成越來越多的工作，「工作」本身還意味著什麼?在 Altman 看來，50 年前的農民無法想像坐在辦公桌前敲鍵盤也能叫工作，就像我們現在也無法想像未來人類會把時間花在那些事情上。不同的是，這次轉變的速度可能快到讓人措手不及。整場訪談中，Altman 展現出一種難得的坦誠。他承認 OpenAI 在某些測試上輸給了競爭對手，承認提前發佈 Sora 是為了讓社會接受假視訊的衝擊，承認「AI slop」(AI 垃圾) 確實是個問題——但話鋒一轉，他補充道：人類自己也一直在製造爛活兒。採訪最後，Altman 耐人尋味地表示，他很羨慕現在 20 歲的創業者，因為有了 AI，機會空間「實在太廣了」。採訪省流版：關於產品發佈和未來方向核心重點是智能體（Agent）：他個人對 Agent 的方向最感興趣，並認為將 Apps 與 ChatGPT 結合會非常強大。Agent Builder 是革命性的：他認為從 GPT Builder 到 Agent Builder 的最大飛躍是模型本身能力的巨大提升。現在的 Agent Builder 實現了「無程式碼革命」，讓普通知識工作者也能輕鬆建構複雜的智能體系統，這是軟體開發領域地震式的變化。語音互動潛力巨大：他不認為語音是唯一的最終互動方式，但在許多場景下是一種非常自然、被低估的互動方式。當前智能音箱體驗不佳是因其背後的 AI 不夠強大，而非語音互動本身的問題。關於 AI 的發展和影響開發速度將極大提升：AI 工具將使軟體開發周期一降再降，讓創業者可以極快地測試和迭代想法。自主智能體即將到來：他認為，像 Code Interpreter 這樣能獨立完成「一周工作量」的智能體，可能很快就能實現，並非遙不可及的目標。技術突破的關鍵在於更聰明的模型、更長的上下文處理能力和更好的記憶系統。AGI 的核心是發現新知識：對他而言，AGI 最重要的衡量標準已不是通過某個測試，而是 AI 開始具備「發現新知識」並擴展人類知識邊界的能力。他對此感到非常樂觀。社會將快速適應 AI：他以「圖靈測試」被超越後社會迅速適應為例，認為人類也會很快習慣 AI 做出科學發現，以及適應由 AI 生成的、真假難辨的視訊內容。關於創業和商業模式創業者的獨特優勢是在實踐中發現的：他建議創業者從「有用、能跑得通」的事情做起，在過程中逐步發現並形成自己的長期優勢（護城河），就像 ChatGPT 的「記憶」功能一樣，是事後才發現其巨大價值的。OpenAI 不想做「超級應用」：他們的目標是建構一個強大的「AI 超級系統」，而不是像微信那樣的「超級 App」。因此，功能（如 Sora 視訊生成）可能會作為獨立應用存在，以適應不同的使用者場景和心態。Sora 等新產品的商業模式仍在探索中：他提到，可能會嘗試讓使用者付費生成視訊，並與授權肖像的名人進行「收入分成」，但最終的商業模式（按次計費、訂閱或廣告）將取決於產品的演化和使用者的主流使用方式。關於社會和未來「AI 製造垃圾工作」是偽命題：他認為低效工作（slop）是人類固有的問題，而非 AI 獨有。經濟體系會自我糾正，最終獎勵那些高效使用工具的人。未來工作的形態會徹底改變：以「農民」作類比，他認為未來由 AI 創造的新工作在我們看來可能「不像真正的工作」，但人類依然會找到新的目標和意義。他擔憂的是轉型的短期陣痛。需要全球性的 AI 安全框架：他認為，隨著模型越來越強大，世界需要一個全球性的框架來降低潛在的災難性風險，這個框架應從一個完善的「測試機制」入手。另外，今天凌晨，Sam Altman 接受 a16z 的訪談視訊也正式公開，我們也整理了其中幾個值得關注的觀點。OpenAI 的核心願景：最終目標是建構通用人工智慧（AGI）並使其對人類有益。實現這一目標的主要方式是為使用者提供「個人 AI 訂閱服務」，這個 AI 將深度瞭解使用者，並在各種裝置和服務中提供幫助。產品與 AGI 的關係（共同進化理論）：像 ChatGPT 和 Sora 這樣的產品，不僅是消費級應用，更是實現 AGI 的關鍵步驟。它們不僅能推動核心研究（如 Sora 幫助建構「世界模型」），更重要的是能讓社會與技術「共同進化」，幫助公眾逐步理解和適應即將到來的技術變革，避免技術成熟後突然衝擊社會。對未來的關鍵預測（AI 科學家）：Sam Altman 個人最興奮的未來方向是「AI 科學家」。他認為，衡量 AI 的真正標準不是圖靈測試，而是當 AI 能獨立進行科學研究並做出新發現時。他預測，在兩年內，AI 模型將能夠承擔更大規模的科研任務，並做出重要的科學發現，這將是推動人類社會進步的巨大變革。商業與戰略：激進地投資基礎設施：由於對未來的研究路線圖和模型經濟價值極度自信，OpenAI 正在進行大規模的基礎設施投資，並與整個行業的眾多公司（如 AMD、Oracle、NVIDIA）展開廣泛合作。對廣告模式持謹慎開放態度：他認為廣告並非完全不可行，但使用者信任是絕不能破壞的底線。任何為商業利益而犧牲推薦質量的廣告模式（如付費推薦產品）都是不可接受的，因為這會摧毀使用者與 ChatGPT 建立的信任關係。支援開源：他認為開源是件好事，並對自家開源模型的受歡迎程度感到高興。提供高品質的開源模型也是一種重要的戰略，可以為全球開發者和學術界提供可靠的選擇。關於版權和資料訓練的看法：他大膽預測，社會最終會認定，用於模型訓練的資料屬於「合理使用（fair use）」。但他認為，直接用 AI 生成受版權保護的內容，則會出現新的規則和商業模式。他觀察到一個新趨勢：許多版權方已經從擔憂「AI 用了我的角色」轉變為擔憂「AI 用我的角色用得不夠多」，他們希望在保證角色形象不受損害的前提下，通過 AI 互動來提升 IP 價值和粉絲粘性。Rowan Cheung：現在是 2025 DevDay，你能不能總結一下今天公佈了那些內容？你個人又對那部分最感興趣？Sam Altman：我對所有內容都很興奮。嗯，我很關注 ChatGPT，這其實是我一直想做的事情——和人們聊聊他們在用它做什麼。智能體（agent）這個問題也讓我很感興趣，很多關於 agent 的內容我真的很想親自用用。但如果非要說一個重點，我覺得 Apps 和 ChatGPT 的結合會非常棒。我很喜歡 Agent 這個方向。Rowan Cheung：如果讓我作為一個開發者去嘗試一些酷炫的東西，那我可能會從那裡開始。另外我們現在有八億使用者了，恭喜啊，這真的很了不起。顯然，ChatGPT 已經成為下一個重要的分發平台。現在開發者可以通過 Apps SDK 建構基於 ChatGPT 的應用，我覺得這是一個巨大的機會。Sam Altman：我覺得我們還需要一些迭代，來摸索出人們真正想怎麼用這些東西。比如：使用者到底更傾向於通過呼叫某個應用來完成任務，還是希望 ChatGPT 本身就知道他們想幹什麼並主動推薦？我認為，開發者最終會找到一種新的分發機制，非常適合他們。但說到底，這些產品推向世界後，總是會帶來一些意想不到的驚喜。Rowan Cheung：我記得你們也發佈了一些文件，教大家怎麼更好地被推薦，是嗎？Sam Altman：是的，不過也要加一句常規提醒：這是全新的產品，變化很快，我們會邊走邊學。但沒錯，這些文件我們今天就會發佈。幾分鐘部署智能體，軟體開發真的在「地震」Rowan Cheung：我很想讀一讀那些文件。嗯，我們來聊聊 Agent Builder（智能體建構器）吧，回到第一次 DevDay 的話題。兩年前，你們發佈了 GPT Builder，那真的很棒。我記得我好像是最早建構公開 GPT 的人之一。那麼，從那時候到現在，你們做了那些重大改進，才有了今天的 Agent Builder？Sam Altman：最主要的變化就是模型本身變得更強大了。我們等下會談到很多方面，但我回頭想想那次首次 Dev Day，模型能力的差距真的非常大。雖然也就二十幾個月，但我們已經走了很長一段路。除此之外，我們還學到了很多使用者想如何建構這種智能體工具。他們也希望能把這些智能體部署到 ChatGPT 之外的其他平台上。我覺得最驚喜的是，現在建構一個複雜系統變得非常簡單。比如你現在可以直接用一個可視化工具，把幾個檔案上傳，配置一些資料來源，告訴它你要實現什麼目標，然後就可以部署了。整個流程只需要幾分鐘。昨天我們還在內部演示，我第一次完整看了一遍整個流程。像 Code Interpreter（程式碼直譯器）、Agent 工具包這些東西，加上整個建構體驗，讓我覺得軟體開發經歷了一場地震式的變化。我自己都還沒完全弄明白這會帶來多大的影響。Rowan Cheung：如果我理解沒錯的話，在 Agent Builder 裡，基本上可以零程式碼建構智能體對吧？Sam Altman：對，完全可以。Rowan Cheung：當然，懂點程式設計會更有幫助，能做更複雜的功能，但普通的知識工作者也可以上手建構。Sam Altman：沒錯，人人都可以建構智能體。Rowan Cheung：這聽起來幾乎就像是一次「無程式碼革命」，只是這次是針對智能體的。Sam Altman：完全同意。就像你說的，懂一點或很多程式碼確實能做出更強大的東西，但最重要的是，現在的入門門檻已經非常低了，幾乎人人都能開始嘗試。Rowan Cheung：你覺得這些變化會對下一波創業者或者開發者產生什麼影響？Sam Altman：這正是我最近一直在努力思考的事情。我在後台看演示時就在想——這些東西在一年前做起來要花費很長時間。而現在，你幾乎可以即時做出來。說真的，我現在已經快跟不上點子生成的速度了。我還不確定這會如何演變，但很明顯，全世界將會有越來越多的軟體被寫出來。測試和迭代的速度會不斷加快，開發周期會一降再降。只是……我現在真的很難完全想明白這意味著什麼。我覺得最明顯的變化是：一切都會發生得更快，你可以快速嘗試很多想法，更快地找到更好的方向。但除此之外，還會帶來什麼變化，我也說不好。「一人公司」離我們只差幾個 promptRowan Cheung：我聽說你和朋友之間還有一個打賭——猜測第一個靠 AI 智能體賺到十億美元的公司會什麼時候出現。你覺得 Agent Builder 會讓這個目標更接近嗎？Sam Altman：可能還沒到那個時候。嗯，之前我們打賭的點是：第一個「一個人公司」靠 AI 賺到十億美元會何時誕生。雖然我們沒正式立個規則，但大家一直在猜什麼時候會出現第一個這種公司。Rowan Cheung：那「零人公司」呢？是幾個月，還是幾年？Sam Altman：我猜，可能還需要幾年。但關鍵是——我們現在已經可以認真地去討論這樣的一天了。你可以直接在 ChatGPT 裡寫個提示詞，然後它就能幫你搞定一切。Rowan Cheung：這已經非常瘋狂了，我完全同意。不過 2025 年原本被很多人認為是「智能體元年」。我們確實看到了一些還不錯的智能體產品，但它們仍然需要大量人工監督和反饋。你覺得什麼時候我們才能擁有那種一整周都不需要人干預的智能體？Sam Altman：我覺得，像 Code Interpreter（程式碼直譯器）這樣的工具，距離完成「一周的工作量」其實已經不遠了。雖然聽起來有點瘋狂，但我覺得這並不是一個遙不可及的 2025 年目標。今天我還和一些人聊起這事，他們也很驚訝地說：「它現在真的已經能完成一天的任務了？怎麼發展得這麼快？」老實說，我通常不會覺得 AI 的進步有多誇張，但在 ChatGPT Code Interpreter 能完成的任務長度這個方面，我真的感受到一種爆炸式的進展。所以我猜，一周等級的任務，可能真的很快就能實現。Rowan Cheung：那要實現這種 Agent，還需要那些技術上的突破？Sam Altman：更聰明的模型、更長的上下文處理能力、更好的記憶系統。Rowan Cheung：好的。你們現在有了 AgentKit、持續升級的模型、Codex，還有 API。看起來現在真的能建構太多東西了。那如果你回到過去，把一個剛從史丹佛退學的 20 歲年輕人帶到現在，並讓他擁有我們今天所有的工具，你覺得他該做什麼，不該做什麼？Sam Altman：我前幾天其實還真在想這個問題。老實說，我挺羨慕現在這代 20 歲的創業者們的，因為他們能做的事情太多了，機會空間實在太廣了。過去幾年裡，我一直沒騰出真正完整的時間去深入想「我要做什麼」，但我知道現在有非常多值得建構的好產品。今天和現場很多人聊天，也被他們正在做的項目震撼到了。真的很棒。Rowan Cheung：我自己也是從零開始，我覺得現場很多開發者可能也是這種狀態。現在能做的東西太多了，你有沒有什麼建議？比如說，在建構產品時，應該尋找怎樣的「獨特優勢」？是分發方式？資料？還是某種工作流模型？Sam Altman：這個問題抽象地講我一直覺得挺難回答的。因為我認為最好的「獨特優勢」，往往是你自己為你要做的事情量身打造的。我們在 OpenAI 也花了很多精力去找到這一點。我覺得這沒有通用的「最佳答案」。最好的回答應該是：你找到了一些，只對你當前產品、技術、市場定位在這個時間點上才成立的獨特東西。而這類東西，往往就構成了你能創造巨大價值的核心。不過，有一點通用的建議我可以說：你是在做的過程中逐步發現優勢的。我很喜歡一句經典的商業名言——「讓戰術變成戰略。」你可以先從一些「有用、能跑得通的事情」開始，往往在這個過程中，就會慢慢浮現出某些可以上升為戰略的東西。如果你在我們剛開始做 ChatGPT 的時候問我：「你們未來會有什麼持久的優勢？」我可能會說「我也不知道」，或者給你一堆猜測，但不會有特別自信的答案。但現在回頭看，像「記憶」功能，其實就成為了一個非常強的競爭優勢，也是使用者持續使用 ChatGPT 的重要原因之一——可當時我們壓根沒想到這點。所以你在建構功能時，有時會意外地發現：「哇，這個點其實可以成為我們長期的護城河。」這就是你一邊走、一邊找、慢慢形成的過程。Rowan Cheung：有沒有什麼跡象能告訴我們，現在在建構產品時應該朝著那種「長期優勢」去努力？比如說該怎麼為 GPT-6 時代佈局？或者說，現在到底該怎麼思考產品建構這件事？Sam Altman：這個嘛，最終還是得你自己去摸索出來。當然如果有時間我很樂意參與頭腦風暴，這事兒本身就挺有趣的。但說實話，OpenAI 現在幾乎佔據了我全部的腦力空間，我已經沒有什麼機會去認真思考怎麼創業了，這點其實還挺遺憾的。我覺得 AI 雖然改變了世界上很多事情，但它並沒有改變一個公司獲得優勢的底層機制。比如說，網路效應、品牌和市場優勢、使用者資料、平台或市場的雙邊效應等等，這些因素過去行得通，現在依然有效。如果你去列一個近幾年成功企業的清單，那些驅動力大機率現在也還適用。只不過，現在可能會有一些新的策略、新的打法罷了。Rowan Cheung：最近發佈了一個叫 GDPval 的基準測試，用來衡量模型在現實經濟中、尤其是典型知識工作崗位上執行任務的能力。讓我有點意外的是，GPT-4.5 的表現排在第二，第一名是一個封閉服務模型。你們還沒發佈 GPT-5，但你對這個結果感到驚訝嗎？Sam Altman：一點也不驚訝。首先，如果我們只能在排名第一的時候才發佈產品，那就太糟糕了。我們不可能在所有事情上都做到最好，這很正常。想要長期變得更好，文化裡必須包含一個元素：坦然承認在某些基準測試上別人更強。有時候別人就是做得比你好。說實話，那家公司確實在理解企業級使用場景上做得很出色，而且輸出格式也非常漂亮。我並不驚訝，反而覺得這激勵我們繼續提升。Rowan Cheung：這個基準測試有沒有影響你們在建構 GPT-6 時的方向？Sam Altman：它會影響我們後續訓練（post-training）的一些方式，但整體上我們對 GPT-6 的核心策略是不會改變的。Rowan Cheung：你之前說過，你對 AGI（通用人工智慧）的定義是：當它在大多數具有經濟價值的任務上超過人類。那麼，如果某個模型在 GDP-V 的得分達到某個程度，你會認為 AGI 實現了嗎？Sam Altman：我最近也在認真思考這個問題。首先，像很多人一樣，我對 AGI 也有多個定義。離目標越近，這個概念反而越模糊。但對我來說，最重要、也是讓我最驚喜的一點是：我們已經開始看到 AI 具備「發現新知識」的能力了。也就是說，AI 可以擴展人類目前的知識邊界。雖然現在這些例子還很小，但這才是我最在意的突破。我真的不想把這件事說得太誇張，但你現在可以在 X 上看到很多例子，科學家們在各個領域都在說：「AI 做出了一個小小的發現」、「它提出了一種全新的方法」、「它解決了某個我們一直沒解開的難題」。而這些背後的原理，我們可能也還沒完全理解。就是這種感覺。現在還只是剛剛開始而已，而我們對未來幾個月、幾年能在這個方向上持續推進感到非常樂觀。這件事意義非常重大。它可能是我最關心的、最接近 AGI（通用人工智慧）的那部分能力。APPSO 註釋：在 a16z 的採訪視訊中，根據 Sam Altman 的觀點，OpenAI 的整體願景和核心使命非常簡單，那就是打造通用人工智慧（AGI）並讓它真正為人類服務。實現這一宏大目標的主要方式，是為每個人提供一種「個人 AI 訂閱服務」。這個個人 AI 將隨著時間推移深度瞭解使用者，變得越來越有幫助，並且使用者可以在 OpenAI 自家的產品、登錄其他第三方服務，甚至在專屬硬體裝置上隨時使用它。為了支撐這一切，公司必須建構龐大的基礎設施，這些設施目前主要服務於這個核心目標和相關的研究。他強調，如此大規模的基礎設施投入遠超單個公司的能力，需要獲得行業大部分力量的支援與協作。因此，OpenAI 將與眾多公司展開廣泛合作，合作範圍覆蓋從底層的電力、電子供應到上層的模型分發系統等所有環節，並且可以預期在未來幾個月裡會宣佈更多新的合作關係。Rowan Cheung：有沒有那個具體的科學突破，是你特別興奮、特別希望 AI 能幫我們實現或解開的？Sam Altman：當然了，比如說治癒某些疾病，或者發現全新的物理規律，這些都是非常令人興奮的方向。即使是現在正在發生的一些「小事」，也同樣令人振奮。比如在數學領域的一些進展，也給人一種特別振奮的感覺——就像 GPT-4 剛發佈時帶來的那種衝擊感。我知道大家對「圖靈測試」到底是什麼意思還存在很多爭議，但從大眾的角度來看，圖靈測試曾經是一個看起來遙不可及的目標。然後，突然之間，它被「通過了」。可整個社會幾乎沒有什麼反應。人們可能討論了兩周，然後就開始說：「這玩意兒怎麼還這麼慢？」、「能不能再做得更好點？」我覺得這其實也說明了人類的偉大——我們非常善於適應。曾經被視為衡量 AI 智能的終極測試，突然之間就被超越了，而我們也很快就習慣了。我現在有種類似的感覺：我們也會很快習慣 AI 做出科學發現這件事。Rowan Cheung：感覺有點像電影《Her》裡人類適應 AI 的情節。Sam Altman：是的，只有第一次覺得奇怪。Rowan Cheung：沒錯，奇怪也就那三分鐘，之後你就習慣了。嗯，我確實感受到了這種趨勢。最近有一個新術語叫做「slop」，意思是那些看起來很精緻、但其實很低效的工作成果。它們通常需要反覆返工才能真正有用。一項針對上千名測試使用者的調查顯示，有 41% 的人表示他們在過去一個月裡，曾從同事那裡遇到過這種「slop」工作流。每次「清理爛攤子」平均花費 1 小時 6 分鐘，每名員工每月因此造成的損失大約是 100 美元。那麼，如果 AI 能夠讓部分人（比如在這個活動現場的很多人）效率提升 10 倍，我們該如何進行教育？如何幫助老師和普通人理解：什麼時候該用 AI，什麼時候不該用？Sam Altman：首先，要說的是，人類自己其實也常常製造「slop」工作流，所以這並不是 AI 獨有的問題。比如那種「寫郵件只是為了製造更多工作」的人，你懂我意思吧。就像會議也是一樣，明明是為了協作，結果反而變成拖累。所以「slop」不是新現象，它在 AI 出現之前就已經存在了。過去就有一類人會用工具提高效率，也有另一類人只是在製造混亂和負擔。我覺得我們也沒必要對 AI 抱有不切實際的期待。經濟體系是自我糾正的——那些真正用工具提高效率的人和公司，最終會獲得更多影響未來的能力；而那些用 AI 拖累組織的人，會自然被邊緣化。像所有新工具一樣，AI 的使用也有學習曲線，但我相信這個學習過程會相對快速。Rowan Cheung：那 OpenAI 有沒有做什麼事情來幫助大家在教育和入門階段更好地掌握這種「使用直覺」？Sam Altman：有的，我們確實在做這方面的工作。人們使用工具的方式就是他們自己的方式。有一件事我學到了，那就是：那怕你提供了再好的教學內容、培訓資源，最後人們還是會發現他們可以用它來——比如說，讓 ChatGPT 模仿海盜說話，然後他們就真的去這麼做了（笑）。但我們確實在努力建立很多內容，幫助人們在真實工作場景中高效使用 AI。比如在 Codex 的推廣過程中，很多公司採用它的速度非常快，甚至在幾天或幾周內就完成了工作流程整合，效果非常好。Rowan Cheung：回到「slop」這個話題，其實這是世界上第一個「以 AI 為中心」的工作年。Sam Altman：是的，可以說是整個網際網路都在經歷這個轉變。Rowan Cheung：你會不會覺得，這種變化也像你之前提到的——目標設得太高，比如 GPU 的使用、算力的投入，等等？Sam Altman：其實這是我原本以為會很奇怪的事情，但結果出人意料地沒那麼怪。甚至有點反常識——你翻看上百個例子，反而比你只看一個還要自然一些。我當時一邊看，一邊還在想這個問題。對了，我還剛完成了一次環球旅行……在產品上線前，團隊裡有個人發消息問我：「我們能不能把你的那個駱駝形象開放訪問？」那一刻我幾乎沒想太多，8 秒內就回覆了同意。但後來想想，其實這事兒也許值得更認真考慮一下。只是當時我心裡也想——這是一項新技術。我知道，如果我連嘗試都不願意，那確實是我的問題。所以我就決定：那就試試吧。後來我坐飛機的時候，終於有點時間思考，就開始想：「這會不會是一次很奇怪的體驗？」然後我自己回答自己：「嗯，可能確實會有點怪。」結果產品上線之後，我看到一些苗頭了——因為 OpenAI 內部的人在測試期間，已經做了很多以我和其他人為主題的 meme。那天我人在亞洲，半夜醒來發了條推文，就又睡回去了。六小時後醒來，我打開手機一看：全是 meme、meme、meme……就這樣被刷屏了。最初幾分鐘確實覺得有點奇怪，但也就三分鐘而已。之後我就釋然了，覺得：「好吧，這就是一個充滿生成視訊的應用。」這些內容挺搞笑的，我也能樂在其中，笑一笑就過去了，並沒有留下什麼奇怪的感覺。Rowan Cheung：我唯一有點擔心的是那些「水印移除工具」。現在市面上有幾家公司發佈了這種功能，我看到有工具可以移除水印。那如果我允許別人用我的形象，他們之後可能會把水印去掉再發到社交媒體上。這樣會不會對我的個人品牌有負面影響？這個權衡該怎麼做？Sam Altman：首先，我們之所以願意發佈這種技術，是因為我們看到某些趨勢已經不可避免地在靠近——無論幾個月還是幾年後，它都會變得廣泛可用。屆時會有優秀的開源模型，任何人都可以用它製作一段你的視訊，讓你「做」任何他們想讓你做的事情，只要你在網際網路上有公開資料，就有可能被生成。當然，社會最終會適應這種變化，但我們認為，提前發佈並設定好「防護欄」，是一種幫助社會逐步適應的好方法。我們以前在文字生成技術上也是這樣做的。視訊則會更難適應，因為視訊的衝擊力遠大於文字。但我相信大家會學得很快——會很快意識到：網上將會出現大量沒有水印、來源難以追蹤的虛假視訊，它們是由某個開源模型生成的，這種事是不可避免的。所以，提前讓社會「接種」這種現實的衝擊，可能是有價值的。Rowan Cheung：所以，「無法分辨真偽的視訊」是目標嗎？Sam Altman：我們最終的目標是 AGI（通用人工智慧）。在實現 AGI 的過程中，高品質的視訊生成會是非常重要的一環，原因有很多，特別是在我們從「世界模型」中學習的時候。希望有一天我們能在機器人領域也取得真正的進展，那時視訊也會非常關鍵。而且我並不希望未來人類與 AI 的互動介面只有文字。我非常期待那種可以通過即時視訊流與 AI 互動的未來，它能帶來一種全新的使用者體驗。所以我覺得這是好事。但更重要的是，我認為這條路對於通向真正的 AGI 來說，是非常關鍵的一步。Rowan Cheung：你們上周五發了一篇部落格，說你們正在探索「收入分成」機制，回饋那些允許用自己面孔生成內容的人。你可以多分享一些細節嗎？這機制會怎麼運作？Sam Altman：可以。其實很多時候你發佈一個新產品，使用者的使用方式會超出你的預期。我們原本以為會是少量創作者在用它製作一些很酷、很複雜的視訊，然後被更大的觀眾群體觀看和傳播。確實有一部分人是按照我們預期的那樣在用這個產品，但實際上，更多人是為了自己和三兩個朋友製作視訊，然後發在動態裡，或者只是在群聊中分享一下，不是公開發佈在平台上。我不確定這種用法是曇花一現的新鮮感，還是會持續下去。但如果它真的持續下去，那就會徹底改變我們對計算資源需求和使用者互動方式的預期模型。也許我們會考慮允許使用者付費生成視訊。比如說，你一天想生成 100 個視訊發給朋友，那沒問題。如果你還想讓視訊裡出現某個名人，而那位名人願意授權，那麼他們也可以從中獲得一定的生成收入分成。所以我們會在這方面做些嘗試。但我也得說，現在就對一個只有六十天的新產品下任何定論都還為時過早。也許這個方向最終根本不成立，也許這根本不是一個真正的「使用場景」，但至少到目前為止，它是一個挺大的趨勢。Rowan Cheung：你們有沒有考慮過在這個產品裡加入廣告的可能性？Sam Altman：目前還沒有，但我覺得這個方向確實有一些值得探索的地方。當然，它也有一些讓人感到非常可怕的潛在風險。不像 ChatGPT，那邊我們已經跑得挺順，有清晰的訂閱制商業模式。而如果這個視訊產品最終的主流用法變成：大家看搞笑內容或高品質視覺內容——那可能就更適合走廣告驅動模式。但如果大多數內容都是私密分享，比如私信裡的視訊，那就可能是完全不同的模式。所以樂觀來看，也許到今年年底——或者這可能太樂觀了，可能要等到明年第一季度末，我們才能真正理解這個產品的最終形態，然後再根據它的走向設計相應的商業模式。至少目前來看，我覺得按次計費、按生成數量收費，是一個合理的方式，值得我們去嘗試。但其他的商業化策略，還要看產品接下來如何演化。APPSO 註釋：在 a16z 的採訪中，Sam Altman 也強調，他對在產品中引入廣告持謹慎的開放態度，並區分了他欣賞的廣告（如 Instagram 上幫助使用者發現新事物的模式）和不喜歡的廣告（如 Google 搜尋中干擾結果的模式）。他強調，對於 ChatGPT 而言，使用者的信任是絕不能破壞的核心原則。人們相信 ChatGPT 是真心想提供幫助，如果為了廣告費而推薦並非最佳的產品，這種信任會瞬間崩塌，因此這種直接影響結果的付費推薦式廣告是絕對行不通的。未來的工作，可能也「不像工作」Rowan Cheung：這個話題真的很有意思，關於「工作」的問題。工作的形態正在改變。我喜歡用「農民」類比來解釋這件事。比如你對 50 年前的農民說，有一個叫「網際網路」的神奇東西，會創造出數十億個新工作崗位，而且人們會坐在辦公桌前工作、開發市場……他大機率是不會相信的。現在我們正處在一個類似的時代——你和很多人都說過，AI 會創造出很多全新的崗位。但現在很難看清這些新工作會是什麼。這次和「網際網路時代」的不同之處在於：網際網路是從零開始創造了很多新職業，而這次 AI 的衝擊，是先影響現有數十億知識工作者的崗位，然後才可能出現新的工作機會。你怎麼看？Sam Altman：你說得非常對，我覺得你點出了一個很關鍵的點——這讓我在某些方面沒那麼擔心，但也在另一些方面更擔心了。關於那個農民，不只是他不會相信這種事真的會發生，他甚至可能會覺得你我現在做的這些根本不算「真正的工作」。你想啊，農民每天種地，是在做大家真正需要的事——他們在生產糧食、維持生命，這才是「真正的工作」。而在他們看來，我們這些未來人，生活太容易了，食物和財富都很豐富，我們做的事情更像是打發時間的「遊戲」，只是為了找點存在感。他們會說：「這算那門子工作？」儘管對我們來說這份工作很真實，至少我自己感到很滿足，也很感激自己能做一份既重要又有意義的事。但也完全有可能，如果我們現在能看見未來那些新工作，我們會說：「好吧，也許我們的工作比不上農民的真實感，但肯定比未來這些『自娛自樂的遊戲』更像工作。」所以我真的相信——是的，人類將來依然會有目標、有動力，但我們對「工作的理解」會發生巨大變化。在未來人眼中，我們現在的工作，可能也會顯得「不那麼像工作」。我也相信，社會契約會隨之改變，尤其是當這個轉變發生得非常快的時候。所以我確實對這場轉型的短期階段感到有些擔憂。但說到底，我依然非常相信人類的動力與創造力，我們一定會找到值得去做的事情。Rowan Cheung：比如探索太空，希望看到更好的 AI 系統等等——你覺得在 AGI 實現之後，人類最有可能會集中精力去做什麼？Sam Altman：我其實更希望——我們能「全面開花」，什麼方向都去探索。太空探索當然很酷，我自己也很感興趣。但也許你、你，還有你，各自會對別的方向感興趣。我希望那個時代的「可能性畫布」能變得無限寬廣，大家都能去做自己真正感到興奮的事。Rowan Cheung：如果你明天可以制定一項全球性政策，你會選擇什麼？Sam Altman：這真的很難只選一項。但我腦海裡一直浮現的，是關於 AI 監管的激烈爭論——到底它是好是壞？是否會讓大公司獲利太多？我能理解這些爭議的各個方面。但我確實認為，隨著模型變得越來越強大，我們需要一個全球框架，來降低潛在的災難性風險。尤其是在那些處於前沿的模型上，我們必須認真思考最嚴重的安全問題。如果能有一項全球政策來應對這個問題，那將是非常有意義的。Rowan Cheung：你能簡單概括一下這個「全球框架」會是什麼樣的嗎？Sam Altman：一開始我會從一個完善的測試機制入手，作為基礎。Rowan Cheung：我還想聊聊「超級應用」這個話題。在中國，像微信這樣的「超級 App」已經涵蓋了幾乎所有功能：購物、支付、聊天……而現在 ChatGPT 也開始支援購物、網頁搜尋、Sora 視訊生成等功能。你們是不是也打算打造一個「美國版的超級 App」？Sam Altman：不是的。嗯，有很多原因讓我覺得這種模式在美國市場並不適用，至少不能用同樣的方式去複製。我們的目標並不是做「超級 App」，而是要建構一個真正強大的 AI 超級系統。Rowan Cheung：那為什麼你們要把這些功能分開發佈？比如 Sora 是一個獨立的應用，為什麼不直接整合到 ChatGPT 裡？Sam Altman：因為對很多使用者來說，ChatGPT 是他們最私人的帳號之一。如果把一個「社交體驗」也強行塞進去，感覺會很奇怪。你可以想像加入一些「消息」功能，因為很多人確實會分享內容、進行協作。但從使用者心態來看，他們對 ChatGPT 的認知，和對一個娛樂類 App 的認知是完全不同的，混在一起會有割裂感。當然，我們也會把很多功能直接加到 ChatGPT 裡，但有些東西還是更適合獨立發佈。Rowan Cheung：我們再聊聊智能體。你覺得現在人們可以建構那些真正重要、有用的 Agent？你最看好那一類？Sam Altman：我覺得可以參考一下 Codex 的發展，然後把這種思路推廣到其他行業。比如：能不能為法律、金融建模，或其他我們已經看到早期成功案例的領域，打造像 Codex 一樣的體驗？其實現在已經有一些很棒的初創公司在做這些方向了。隨著技術的成熟，如果你能讓這些 Agent 在各自行業中，做到像 Codex 在程式設計領域那樣強大，那將是我最感興趣的方向之一。我可以想像未來這樣的場景：一個人只需要和一堆 Agent 對話，就能啟動一個公司。現在的 Agent Builder 和 AgentKit 還沒完全達到這個水平，但我能看到我們正在往這個方向靠近。Rowan Cheung：我記得你在主題演講裡提到，「語音」可能會成為 AI 智能體的最終介面。你能展開講講嗎？Sam Altman：我不覺得語音是最終的互動方式。很多場景下，語音其實並不適用——比如在公共交通上，和裝置對話就很不方便，甚至有點尷尬。但在很多情況下，語音確實是一種非常自然的互動方式，尤其是語言本身的交流。儘管有時候，打字仍然是更合適的方式。我覺得我們其實低估了語音互動的潛力。大家現在總是拿智能音箱這個類別開玩笑，但我們忽略了，其實很多人真的在用這些裝置，而且很喜歡它們——儘管它們現在的體驗還很差，主要是因為以前的 AI 不夠好，生態基礎也沒跟上。但你想想未來會怎樣：如果你能隨口對裝置說一句，它就能完全精準地幫你完成任務——那種感覺，可能就真的像擁有了一個「理想中的電腦」。Rowan Cheung：我很期待能夠使用它。能不能透露一點關於你們在 I/O（裝置端）正在做的事情？是不是會有語音互動？Sam Altman：我們還需要一段時間。這個方向確實需要大家多一點耐心。要做出一種全新類型的裝置，而且要達到極高的品質標準、還能大規模生產，這等於是重新定義人與電腦的互動方式。我們需要一定的創作空間來把這個事情摸索清楚。我們確實有一些非常令人興奮的想法，但目前還不準備公開談論，而且在短期內也不會說太多。但我們會努力做出一個真正值得使用、非常有意義的產品。Rowan Cheung：好吧，那今天就聊到這。Sam Altman：非常感謝。 (APPSO)

Sora 2免費！OpenAI又炸了！

凌晨被OpenAI刷屏了嗎？😱 這次不是GPT，是Sora 2——一個能讓你"活"在AI視訊裡的神器！還記得今年2月那個讓全網驚呼的Sora 1嗎?那只是"開胃菜"。現在Sora 2直接跳到了"主菜時刻"🚀：奧運體操、衝浪後空翻、花樣滑冰三周跳，物理規律它全懂!籃球投籃不進?球會真實反彈,不會像以前那樣"瞬移"進筐。這AI不只會生成視訊,它在模擬真實世界!更炸的是"上傳自己"功能——錄段短影片,AI就能把你"空投"到任何場景:和大腳怪自拍、在維京戰船上怒吼、甚至讓貓咪在你頭上玩triple axel! 聲音、表情、動作,高度還原,就像真拍的一樣。矽谷團隊內測時,同事們因為這功能交了一堆新朋友,簡直是"emoji 2.0時代"的社交革命💬!OpenAI還專門做了個iOS社交App,叫"Sora",主打創作不刷屏——演算法不追求你停留時長,而是激發你二創靈感。青少年有每日觀看限制,家長能通過ChatGPT管控,還能隨時撤銷你的"數字分身"授權。你的樣子你做主,這波安全設計給滿分!目前Sora 2在美國和加拿大免費開放(有額度限制),ChatGPT Pro使用者能用更高畫質的Pro版。視訊生成這麼快進化,通用世界模擬器離我們還遠嗎?想像一下,未來AI能精準預測物理世界、訓練機器人…這才是真·改變人類的技術! (澤問科技)